Sign In
Free Sign Up
  • English
  • Español
  • 简体中文
  • Deutsch
  • 日本語
Sign In
Free Sign Up
  • English
  • Español
  • 简体中文
  • Deutsch
  • 日本語
images
通过战略性文档重新排序技术提升RAG性能

RAG的第一步是检索每个查询的多个文档,通常这些文档与查询无关。因此,我们需要一些外部技术来改进这些结果。最终,搜索的强大程度取决于其结果的相关性。 在应用向量搜索时,由于一些原因,常常会丢失一些语义信息。例如,文档需要被分解为较小的子文档,这可能导致上下文 ...

images
通过向量搜索在高级RAG中革命性地改进数据检索

在这系列关于高级RAG管道的文章中,我们讨论了嵌入模型、索引方法和分块技术等其他组件如何构建高效系统的基础。现在,让我们探讨这个管道中一个非常重要的部分:向量搜索。 数据库的核心能力在于其搜索性能。从网页搜索到物体识别,应用场景数不胜数,因此,搜索的效率、多功能性和准确性至关重要。稍慢或不准确(或有限)的搜索可能是客户是否满意以及是否会再次光临的关键,而商家对此深知。 向量搜索在现代检 ...

images
MyScale vs Weaviate:为您的AI应用选择合适的向量数据库

向量数据库正在兴起,其应用无处不在。它们具有超高的速度(想象一下在几分之一秒内搜索数十亿条记录),并且需要更少的资源(不需要任何GPU)。尽管如此,它们的性能出色,足以在公共卫生、金融和生物识别等领域使用。 现有许多向量数据库,其中MyScale是其中一个特殊的向量数据库,它是一种基于SQL的向量数据库。无论您是已经是向量数据库用户还是对它们还不熟悉,选择其中之一可能会很棘手;它取决于许多因素, ...

images
MyScale vs Qdrant:深入探究向量数据库性能

向量数据库和向量搜索由于其出色的速度和可扩展性而迅速赢得了人们的青睐。与传统的机器学习模型不同,这些数据库利用高效的相似度度量,如[欧几里得距离 ...

images
MyScale vs. Zilliz:成本效益之战

向量数据库和向量搜索由于其速度和可扩展性而迅速受到欢迎。与需要大量训练的传统机器学习模型不同,向量搜索可以使用基本的相似度度量(如欧氏距离和余弦相似度)在向量数据库中快速执行。这使得它们在可扩展性和成本效益方面比基于机器学习的模型更具优势。 随着向量数据库的使用不断增长,自然而然地会寻求基于特定需求的最适合的数据库,考虑吞吐量和成本等各种因素。为了帮助用户做出明智的决策,我们推出了一系列文章,详 ...

images
MyScale vs. Pinecone:大规模数据管理的最佳选择

在提到数据库时,关系数据库因其简单性和易用性,长期以来一直是数据存储的默认选择。然而,在当今以数据为驱动的互联网行业中,非结构化数据(如文本、图像和音频)的存储需求日益增多,使得[向量数据库](https://myscale.com/blog/zh/u ...

images
使用高级SQL向量查询增强您的RAG应用程序

检索增强生成(RAG)在我们与数据交互的方式上进行了革命性的改变,提供了无与伦比的相似性搜索性能。它擅长根据简单查询检索相关信息。然而,当处理更复杂的任务时,如基于时间的查询或复杂的关系数据库查询,RAG往往表现不佳。这是因为RAG ...

images
通过LangChain对高级RAG系统进行Reranking的增强

LangChain 是一种颠覆我们与语言模型互动方式的尖端技术。LangChain将大型语言模型(LLM)的强大能力与外部知识库相结合,通过检索增强生成(RAG)提升这些模型的能力。这种整合使得参数化的语言模型和来自外部来源的非参数化数据之间的信息流动变得无缝。 本质上,LangChain充当传统语言模型和庞大外部知识库之间 ...

images
如何在MyScaleDB中运行复杂的SQL查询进行向量搜索

向量搜索是基于向量表示的数据集中寻找相似向量或数据点的方法。与Pinecone、Milvus、Qdrant和Weaviate等专有向量数据库不同,MyScaleDB是基于开源的与SQL兼容的ClickHouse数据库构建的。 结构化查询语言(SQL)是管理关系数据库的有效工具。MyScaleDB将SQL和向量的强大功能结合起来,以处理复杂的AI相关问题。用户可以在结构化数据和向量嵌入(数据)上执 ...

images
MyScale vs. Elasticsearch:高效升级和替代方案

向量数据库专门设计用于存储和管理向量数据,在许多人工智能应用中发挥着关键作用,如语义文本搜索和图像搜索。虽然传统的词项匹配和BM25算法在文本检索中仍然具有重要意义,但广泛采用的Elasticsearch系统最近也增加了向量搜索功能。值得注意的是,开源高性能SQL向量数据库MyScaleDB最近也引入了全文搜索 ...

images
在 MyScale 中使用 Jina AI 的 Reranker API 增强搜索结果

在我们的上一篇博客中,我们探讨了将向量搜索与重新排序方法相结合,以解决向量搜索的固有限制,例如在文本到向量转换过程中可能丢失信息的问题。这种集成使其成为复杂查询意图的强大解决方案,显著提高了整体搜索准确性。 在当今各种重 ...

images
过滤向量搜索:重要性及技术解析

向量搜索可以在大量文本、图像和其他数据中快速定位语义上相似或相关的候选。然而,在实际应用场景中,纯向量搜索通常是不够的。 实际数据通常包含时间、类别、用户 ID 和其他关键词等属性。对这些属性应用一个或多个过滤条件可以显著提高检索增强生成(RAG)系统的准确性,同时为大规模多租户系统奠定基础。基于 ClickHouse 数据库开发的 MyScale 支持各种 SQL 数据类型,实现了高准确性和高 ...